Меню
Публикации
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор
НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2020-20-1-66-73
УДК 004.7
МЕТОДИКА ДИФФЕРЕНЦИРОВАННОГО НАРАЩИВАНИЯ ЕМКОСТИ СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ С МНОГОУРОВНЕВОЙ СТРУКТУРОЙ
Читать статью полностью
Язык статьи - русский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Татарникова Т.М., Пойманова Е.Д. Методика дифференцированного наращивания емкости системы хранения данных с многоуровневой структурой // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 1. № 1. С. 66–73. doi: 10.17586/2226-1494-2020-20-1-66-73
Аннотация
Предмет исследования. Предложена методика дифференцированного наращивания емкости хранилища данных, построенная на прогнозной модели временных рядов с оценкой объема поступающего на хранение трафика. Рассмотрено влияние структуры входящего потока данных на выбор модели прогноза. Метод. Система хранения данных формализована в виде матрицы, устанавливающей количество уровней хранения и количество носителей/томов на каждом уровне. Элементами матрицы являются метаданные файлов, которые хранятся на соответствующих носителях/томах многоуровневой системы хранения данных. Матрица визуализирует состояние хранилища данных в виде паттернов. Построение паттернов выполняется с помощью систематических срезов значений матрицы. Периодический анализ паттернов состояния хранилища данных позволяет оценить время достижения предельного значения емкости носителя. Прогнозная модель, положенная в основу методики дифференцированного наращивания емкости хранилища данных, учитывает структуру входящего потока данных. При наличии самоподобной структуры поступающего на хранение трафика реализуется прогнозная модель авторегрессии и проинтегрированного скользящего среднего. Для трафика без самоподобной структуры реализуется общая линейная модель прогноза временного ряда при известных прошлых значениях. Модель прогноза применяется отдельно для каждого носителя/тома уровня хранения. Основные результаты. Приведены особенности структуры трафика, поступающего на хранение. Проверены свойства самоподобия на примере LTE-трафика, демонстрирующие наличие распределений с «тяжелыми хвостами». С помощью модели авторегрессии и проинтегрированного скользящего среднего получены результаты прогноза объема поступающего на хранение трафика. Приведены прогнозные и реальные значения объема трафика, а также величина ошибки прогноза. Разработана методика дифференцированного наращивания емкости системы хранения данных, устанавливающая последовательность шагов анализа паттернов и структуры трафика, поступающего на хранение. Практическая значимость. Методика наращивания емкости хранилища данных учитывает многоуровневую организацию хранения и структуру поступающего потока данных, позволяет организовать дифференцированное наращивание емкости хранилища в соответствии с характеристиками файлов и обеспечением требований к времени гарантированного хранения.
Ключевые слова: многоуровневое хранение, система хранения данных, хранилище данных, структура трафика, паттерн состояния хранилища данных, модель прогноза, методика наращивания емкости хранилища
Список литературы
Список литературы
1. Проскуряков Н.Е., Ануфриева А.Ю. Анализ и перспективы современных систем хранения цифровых данных // Известия Тульского государственного университета. Технические науки. 2013. № 3. С. 368–377.
2. Information Storage and Management. 2nd ed. New Jersey: John Wiley & Sons Inc., 2016. 544 p.
3. Farley M. Building Storage Networks. 2nd ed. Osborne: McGraw- Hall, 2001. 576 p.
4. Леонов В. Google Docs, Windows Live и другие облачные технологии. М.: Эксмо-Пресс, 2012. 304 с.
5. Богатырев В.А., Богатырев С.В., Богатырев А.В. Надежность кластерных вычислительных систем с дублированными связями серверов и устройств хранения // Информационные технологии. 2013. № 2. С. 27–32.
6. Mesnier M., Ganger G., Riedel E. Object-based storage // IEEE Communications Magazine. 2003. V. 41. N 8. P. 84–90. doi: 10.1109/MCOM.2003.1222722
7. Carr N.G. The Big Switch: Our New Digital Destiny. WW Norton & Company, 2008. 258 p.
8. Бурмистров В.Д., Заковряшин Е.М. Создание хранилища данных для распределенной системы // Молодой ученый. 2016. № 12. С. 143–147.
9. Buyya R., Broberg J., Goscinski A.M. Cloud Computing: Principles and Paradigms. New Jersey: John Wiley & Sons Inc., 2011. 637 p.
10. Советов Б.Я., Татарникова Т.М., Пойманова Е.Д. Организация многоуровневого хранения данных // Информационно- управляющие системы. 2019. № 2. С. 68–75. doi: 10.31799/1684-8853-2019-2-68-75
11. Kish L.B., Granqvist C.G. Does information have mass? // Proceedings of the IEEE. 2013. V. 101. N 9. P. 1895–1899. doi: 10.1109/JPROC.2013.2273720
12. Morville P., Callender J. Search Patterns: Design for Discovery. O’Reilly Publ., 2010. 192 p.
13. Stacey M., Salvatore J., Jorgensen A. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. New Jersey: John Wiley & Sons Inc., 2013. 432 p.
14. Poymanova E.D., Tatarnikova T.M. Models and methods for studying network traffic // 2018 Wave Electronics and its Application in Information and Telecommunication Systems, WECONF 2018. 2018. P. 8604470. doi: 10.1109/WECONF.2018.8604470
2. Information Storage and Management. 2nd ed. New Jersey: John Wiley & Sons Inc., 2016. 544 p.
3. Farley M. Building Storage Networks. 2nd ed. Osborne: McGraw- Hall, 2001. 576 p.
4. Леонов В. Google Docs, Windows Live и другие облачные технологии. М.: Эксмо-Пресс, 2012. 304 с.
5. Богатырев В.А., Богатырев С.В., Богатырев А.В. Надежность кластерных вычислительных систем с дублированными связями серверов и устройств хранения // Информационные технологии. 2013. № 2. С. 27–32.
6. Mesnier M., Ganger G., Riedel E. Object-based storage // IEEE Communications Magazine. 2003. V. 41. N 8. P. 84–90. doi: 10.1109/MCOM.2003.1222722
7. Carr N.G. The Big Switch: Our New Digital Destiny. WW Norton & Company, 2008. 258 p.
8. Бурмистров В.Д., Заковряшин Е.М. Создание хранилища данных для распределенной системы // Молодой ученый. 2016. № 12. С. 143–147.
9. Buyya R., Broberg J., Goscinski A.M. Cloud Computing: Principles and Paradigms. New Jersey: John Wiley & Sons Inc., 2011. 637 p.
10. Советов Б.Я., Татарникова Т.М., Пойманова Е.Д. Организация многоуровневого хранения данных // Информационно- управляющие системы. 2019. № 2. С. 68–75. doi: 10.31799/1684-8853-2019-2-68-75
11. Kish L.B., Granqvist C.G. Does information have mass? // Proceedings of the IEEE. 2013. V. 101. N 9. P. 1895–1899. doi: 10.1109/JPROC.2013.2273720
12. Morville P., Callender J. Search Patterns: Design for Discovery. O’Reilly Publ., 2010. 192 p.
13. Stacey M., Salvatore J., Jorgensen A. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. New Jersey: John Wiley & Sons Inc., 2013. 432 p.
14. Poymanova E.D., Tatarnikova T.M. Models and methods for studying network traffic // 2018 Wave Electronics and its Application in Information and Telecommunication Systems, WECONF 2018. 2018. P. 8604470. doi: 10.1109/WECONF.2018.8604470